PDF 지원
Claude에서 열기
이 강좌에 대해 질문하기
노트 복사
LLM용 전체 강좌 노트 복사
Claude는 PDF 파일을 직접 읽고 분석할 수 있어 문서 처리에 강력한 도구입니다. 이 기능은 이미지 처리와 유사하게 작동하지만, 코드 구조에 있어 몇 가지 주요 차이점이 있습니다.
PDF 처리 설정하기
Claude로 PDF 파일을 처리하려면 이미지 처리에 사용하는 코드와 거의 동일한 코드를 사용합니다. 주요 차이점은 파일 형식 지정 및 명확성을 위한 변수 이름에 있습니다.
기존 이미지 처리 코드를 PDF용으로 수정하는 방법은 다음과 같습니다:
with open("earth.pdf", "rb") as f:
file_bytes = base64.standard_b64encode(f.read()).decode("utf-8")
messages = []
add_user_message(
messages,
[
{
"type": "document",
"source": {
"type": "base64",
"media_type": "application/pdf",
"data": file_bytes,
},
},
{"type": "text", "text": "Summarize the document in one sentence"},
],
)
chat(messages)
이미지 처리와의 주요 변경 사항
이미지 처리 코드를 PDF용으로 변환할 때 다음 요소들을 업데이트해야 합니다:
-
파일 확장자를
.png에서.pdf로 변경 -
명확성을 위해 변수 이름을
image_bytes에서file_bytes로 변경 -
타입을
"image"대신"document"로 설정 -
미디어 타입을
"image/png"대신"application/pdf"로 변경
Claude가 PDF에서 추출할 수 있는 것들
Claude의 PDF 처리 기능은 단순한 텍스트 추출을 넘어섭니다. 다음을 분석하고 이해할 수 있습니다:
- 문서 전체의 텍스트 내용
- PDF에 포함된 이미지와 차트
- 표와 데이터 관계
- 문서 구조 및 서식
이를 통해 Claude는 요약, 데이터 분석, 특정 내용 추출 등 PDF 문서에서 모든 유형의 정보를 추출하는 원스톱 솔루션이 됩니다.
위 예시는 Claude가 PDF로 저장된 지구에 관한 위키피디아 문서를 성공적으로 처리하여, 복잡한 문서 내용을 한 문장으로 이해하고 요약할 수 있음을 보여줍니다.
